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Рассмотрен новый непараметрический алгоритм текстурного анализа. Обсуждаются как вопросы влияния размера скользящего 
окна на результат текстурного анализа, так и вопросы выбора подмножества информативных текстурных признаков. В статье да- 
ны результаты работы рассмотренного алгоритма текстурного анализа. 


Введение 

Объектам реального мира свойственна целост- 
ность при решении задач узнавания и восприятие 
лишь части объекта зачастую не позволяет класси- 
фицировать их однозначно. В разделах теории по 
распознаванию образов показано, что привлечение 
контекстной информации существенно повышает 
качество решающих правил. Широко распростра- 
ненная практика поэлементной (пиксельной) 
классификации аэрокосмической информации на 
основе их спектральных яркостей часто оказывает- 
ся некорректной из-за значительной простран- 
ственной изменчивости отражательных характе- 
ристик основных классов земной поверхности. Не- 
обходимость в более эффективных методах анали- 
за аэрокосмических изображений ставит на первый 
план проблему учета контекстной информации в 
алгоритмах распознавания образов. Если между со- 
седними элементами изображения имеется замет- 
ная статистическая связь, она порождает локаль- 
ный пространственный контекст. Источники кон- 
текстной информации могут находиться в самом 
изображении, выражаясь в виде определенных 
правил пространственной организации элементов. 
В этом случае целесообразно применение методов 
текстурного анализа для распознавания образов на 
изображении. 

Для проведения текстурного анализа необходимо: 

1. Определить цель текстурного анализа. 

2. Сформировать систему текстурных признаков. 

3. На анализируемом изображении определить 
необходимое для выполнения поставленной це- 
ли количество классов и с помощью эксперта 
назначить образцы текстур для каждого класса. 

4. Провести обучение алгоритма на текстурах-об- 
разцах и сформировать подсистему наиболее 
информативных текстурных признаков. 

5. Используя выбранную подсистему признаков, 
распознать все изображение. 

Система текстурных признаков 

При компьютерном анализе аэрокосмических 
изображений важной характеристикой при форми- 
ровании признаков служит текстура. Под текстурой 
понимается некоторым образом организованный 
локальный участок видеоданных, обладающий 


свойством однородности. Текстура содержит об- 
ширную информацию о поверхности и ее взаимос- 
вязи с окружающим пространством. Основной 
проблемой, возникающей при решении задачи ана- 
лиза текстур, является определение системы приз- 
наков для описания пространственной текстуры, 
присутствующей в изображении. Под признаками 
текстур обычно понимают характерные свойства, 
общие для всех текстур данного класса [1]. Текстур- 
ные признаки играют решающую роль для их клас- 
сификации и при разделении изображений на от- 
дельные области. Большое количество текстурных 
признаков рассмотрено в работах [2-^]. Формаль- 
ной процедуры задания исходной системы призна- 
ков пока не существует. Признаки, используемые 
при решении тех или иных задач, задаются лишь на 
основании опыта и интуиции специалиста. Для 
распознавания спутниковых изображений нами за- 
дана следующая система текстурных признаков: 

Энергия: 

N-1 N-1 

7= XIX’. 

і =0 7=0 

где (V- количество градаций яркости изображения, 
Р - матрица смежности [3, 5] (другое название - 
матрица распределения градиентов [2]). Следует за- 
метить, что матрица смежности зависит от четырех 
параметров: /, у - спектральные яркости пары эле- 
ментов матрицы смежности, а - направление подс- 
чета матрицы смежности, ё - расстояние между 
точками при подсчете матрицы смежности. Здесь и 
далее вместо Р(іф,а,ё) будем писать просто Р и . 

Энтропия: 

ІѴ-1 N-1 

/;.-ХХа іоц /’ . 

/=0 7=0 

Энтропия выражает неравномерность распреде- 
ления яркостных свойств элементов изображения. 

Максимальная вероятность: 

Г 3 = тах Р і .. 

Максимальная вероятность выражает наиболь- 
шее значение в матрице смежности. 

к - ый начальный момент: 

1=1 У = 1 
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где 5 — размер скользящего окна в пикселях, Л Х >У) ~ 
яркость пикселя в точке (х,у) скользящего окна. 

Вариация: 

г 5 =І>-я> 2 ^0г), 

8=0 

где Р(§) - количество пикселей с яркостью §, 
/и - среднее в окне ( ГД 
Однородность: 

N-1 N-1 

^ИХ/а+и-Л). 

/= 0 у =0 

Второй угловой момент: 

т 7 = І ±(ѴМ)\ 

і=і 2=1 


где М- общее количество пар, примыкающих друг 
к другу элементов, (например, для аМІ, а=0, 
М=2ЛД/Ѵ 1 -І), Д, /Ѵ ѵ - количество элементов разре- 
шения скользящего окна по горизонтали и верти- 
кали соответственно). Второй угловой момент яв- 
ляется мерой гомогенности изображения и прини- 
мает в этом случае минимальное значение. 

Контраст: 


?;=2> 2 




;=і 2=1 




Контраст определяется величиной локальных 
вариаций яркости изображения. С увеличением 
числа локальных вариаций контраст возрастает. 
Дисперсия: 

Т 9 =І^(і-т)\Р иі ІМ), 

1=1 2=1 


где т - математическое ожидание матрицы смеж- 
ности. Дисперсия определяет вариации яркости 
относительно среднего значения. 

Момент обратной разности: 

Т 10 = Ц[1 + (і- Л 2 ] \Р иі ІМ), 

1=1 2=1 

Момент обратной разности тесно связан с 
контрастом и отражает степень разброса элементов 
матрицы градиентов вокруг главной диагонали. 
Этот признак является альтернативой контрасту в 
случае влияния краевых структур, поскольку отно- 
сительно большие разности в значениях яркости 
вносят минимальный вклад в конечный результат. 

Суммарное среднее: 

2N 

Т и =ІДГ + («), 

п-2 

где р + (п)=ІІ,Р и / М, при і+]=п, л=2,3,...,2Л г - гистог- 
рамма сумм значений яркости. Суммарное среднее 
определяется гистограммой сумм значений яркос- 
ти р + (п) по парам элементов изображения, которая 
непосредственно связана с матрицей смежности. 


Суммарная дисперсия: 

2 N 

Тп=Ц(п- Т ы) 2 РЛп\ 

п=2 

Суммарная дисперсия служит мерой вариаций 
яркости относительно суммарного среднего. 

Суммарная энтропия: 

2 » 

Т \1 =2д + («) 1о §Г + («)- 

п=2 

Суммарная энтропия определяется классичес- 
кой мерой статистической теории информации и 
выражает неравномерность распределения яркост- 
ных свойств элементов изображения. 

Дифференциальная дисперсия: 

т и = ^[п~'2<РЛт)] 2 р_(п), \і~І\=т, 

я=0 т=0 

N N 

где рХгі)=І2.Р и / М, при \і-]\=п, и=0, I ,...,N—1 - гис- 
тограмма разностей значений яркостей. Диффе- 
ренциальная дисперсия выражается через гистог- 
рамму разностей значений яркости р_(гі) по парам 
элементов изображения, которая образуется из 
матрицы смежности. 

Дифференциальная энтропия: 

Т 15 =-^р_(п)\о§р_(п). 

т=0 

Дифференциальная энтропия рассчитывается 
как суммарная энтропия, но для гистограммы раз- 
ностей значений яркости. 

Эта система используется как библиотека текс- 
турных признаков, из которой алгоритм выбирает 
наиболее информативные признаки. Все приве- 
денные признаки вычисляются по каждому из пяти 
каналов прибора АѴНКК спутника ЫОАА. 

Выбор размера скользящего окна 

Текстурные признаки зависят от размера окре- 
стности, на которой они определяются. Размер ло- 
кального фрагмента, являющегося носителем текс- 
турных свойств, естественно определять из компро- 
миссного желания иметь устойчивые оценки приз- 
наков, которые обеспечиваются фрагментом боль- 
шого размера, и сохранить свойства однородности, 
обеспечиваемые небольшим фрагментом. От раз- 
мера скользящего окна зависит, какие свойства 
ландшафтных объектов характеризуют вычисляе- 
мые текстурные признаки и в каком масштабе. Так 
в более крупном окне отражаются свойства текстур- 
ной однородности более крупных ландшафтных 
объектов, при этом влияние отдельных пикселей 
окна на величину текстурной оценки снижается и 
заметно ухудшается пространственное разрешение 
конечной классификации. С другой стороны, в 
слишком малом окне может оказаться недостаточ- 
но статистической информации для адекватного 
описания свойств ландшафтных объектов [6]. 
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Выбор текстурных признаков 

К сожалению, не существует теории синтеза 
текстурных признаков, обеспечивающих, напри- 
мер, минимум средних ошибок распознавания. В 
связи с этим текстурные признаки пока изобретают- 
ся, а качество их проверяется эмпирически для 
конкретной задачи классификации. Поэтому оправ- 
дан такой подход: синтезировать большое количест- 
во текстурных признаков и исследовать все подмно- 
жества текстурных признаков на информативность. 

При всех положительных качествах текстурных 
признаков их основной недостаток заключается в 
том, что достаточно часто при анализе изображе- 
ний в рамках скользящего окна будут попадаться 
не только однородные текстуры одного класса, но 
и комбинации классов и границы разделов различ- 
ных текстур. В этом случае значение текстурного 
признака несет в себе смешанные свойства объек- 
тов подстилающей поверхности Земли и чтобы 
усилить роль центральных пикселов, относительно 
которых производятся те или иные оценки, следует 
расширить набор текстурных признаков добавле- 
нием спектральных компонент. Таким образом, мы 
получаем расширенную систему спектрально-текс- 
турных признаков [6]. Кроме того, не все рассмот- 
ренные текстурные характеристики одинаково ин- 
формативны при классификации тех или иных 
ландшафтных образований, поэтому для увеличе- 
ния вычислительной эффективности реализующих 
его алгоритмов необходимо решать задачу анализа 
информативности и оптимизации расширенной 
системы признаков. 

Основной вопрос при построении системы 
признаков заключается в том, чтобы определить 
какие и сколько признаков необходимо выделить 
для надежной классификации объектов на аэро- 
космическом изображении. При этом следует ру- 
ководствоваться принципом учета свойств регу- 
лярности объекта - если классифицируемый объ- 
ект обладает некоторой регулярностью, то эту регу- 
лярность необходимо положить в основу формиро- 
вания системы признаков. Более того, необходимо 
учитывать, чтобы эта регулярность была присуща 
всем объектам, принадлежащим данному классу. 

Существует мнение, что нужно задавать все, что 
позволяет увеличить количество информации. Но 
это верно только в принципе. На практике же чрез- 
мерное увеличение исходной системы признаков 
не приносит положительного эффекта из-за того, 
что степень представительности выборки одного и 
того же объема обратно пропорциональна размер- 
ности пространства признаков. В случае использо- 
вания некоторых решающих функций добавление 
признаков при малой обучающей выборке может 
не только не улучшить, но даже ухудшить качество 
обучения устройства. Разумеется, при неограни- 
ченной выборке добавление признака, даже не не- 
сущего никакой информации, никогда не может 
ухудшить качество распознавания. 


В проблеме выбора информативных признаков 
следует выделить два основных момента, во-пер- 
вых, необходимо определить функционал инфор- 
мативности подсистемы признаков и во-вторых, 
определить правило формирования последователь- 
ностей исследуемых на информативность подпро- 
странств признаков [7]. Прежде всего, заметим, что 
адекватным задаче оценивания качества признаков 
является лишь средний риск, или эмпирическая 
оценка последнего по обучающей выборке, то есть 
тот же критерий, минимизацией которого получено 
оптимальное (байесово) правило распознавания 
образов. Что касается способов выбора подпрост- 
ранств признаков, то разнообразие применяемых 
на практике способов невелико. Заметим, что ре- 
шение поставленной задачи известно и тривиально: 
для получения оптимальной подсистемы из к приз- 
наков, выбранных среди п исходных компонент 
вектора наблюдения, нужно лишь произвести срав- 
нения вычисленных на разных ^-мерных подпрост- 
ранствах значения критерия информативности и 
зафиксировать тот набор к признаков, на котором 
выбранный критерий достигает оптимума. Количе- 
ство таких подсчетов критерия оптимальности рав- 
но числу С* - сочетаний из п признаков по к и даже 
для сравнительно небольших кип составляет аст- 
рономические цифры затрат машинного времени. 

Ввиду сказанного, на практике широко приме- 
няются способы усеченных переборов подпрост- 
ранств признаков. Так в алгоритме "Е)еГ [8], осуще- 
ствляется усеченный перебор, сокращающий сис- 
тему признаков путем выбрасывания одного за 
другим малоинформативных признаков. В другом 
варианте "АсШ" [8] система информативных приз- 
наков набирается последовательно путем включе- 
ния один за другим высокоинформативных приз- 
наков. Нами реализован комбинированный алго- 
ритм выбора информативных подпространств к 
признаков, представляющий собой модифициро- 
ванный вариант усеченного перебора. Процесс 
расширения системы признаков блоками продол- 
жается до тех пор, пока информативная совокуп- 
ность /+/'+...+/ признаков не достигнет искомой ве- 
личины к. В частном случае, полагая /=/=... =/=І , 
мы получим алгоритм "Абсі". Аналогичное обобще- 
ние допускает алгоритм усеченного перебора подп- 
ространств "БеГ, в котором сокращение исходной 
размерности п также осуществляется блоками в ре- 
жиме условно полного перебора. Тем самым, пред- 
лагаемый алгоритм позволяет рассматривать до- 
полнительные варианты пространств признаков и 
исследовать их на информативность. 

Непараметрический алгоритм текстурного анализа 

Пусть результатом наблюдения является сово- 
купность оцифрованных полей видеоданных, за- 
данных в нескольких спектральных диапазонах, так 
что каждый пиксел изображения подстилающей 
поверхности Земли и облачности, зафиксирован- 
ных системой регистрации, характеризуется слу- 
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чайным вектором Х={Х\...,Х"У, где Г- знак транс- 
понирования. Компоненты Х\ і=\,...,п (здесь и да- 
лее п - количество компонент вектора X) вектора 
наблюдения Охарактеризуют отражательные (ради- 
ояркостные) свойства ландшафтов и облачности в 
каждом спектральном диапазоне соответственно. 

Перед началом работы алгоритма эксперт или 
учитель задает /Ѵ ѵ обучающих выборок то 

есть /Ѵ ѵ - объем выборки класса ѵ, ѵе I для каждого 
из I классов и указывает значения компонентов 
вектора плана экспериментов ,/ , ) г . При 

этом количество классов, количество фрагментов в 
каждом классе и количество и значения компонен- 
тов вектора экспериментов определяется учителем, 
исходя из целей задачи. Затем алгоритм из всего 
множества Я текстурных и спектральных призна- 
ков, заданных в программе, перебирает все подм- 
ножества признаков. Количество признаков в 
подмножестве определяется значением компонен- 
ты Р плана экспериментов. Используя каждое те- 
кущее подмножество признаков, алгоритм заново 
распределяет образцовые фрагменты по классам по 
минимуму среднего риска. Средний риск (эмпири- 
ческий риск) оценивается по формуле: 

г = Р(ѵ)І{ѵ = аг§ тах Р{ц)р(Х) \ /л)}, (1) 

ѵеі #1бЛ 


где ц, ѵеУ; У - пространство классов, У={1,...,У}, 
У - число классов; /{"истина"}=0, 7{"ложь"}=1 - ха- 
рактеристическая функция; и(х)=ъщ птахДц)Дх|ц) 
- байесово решающее правило в иной, тождествен- 
ной записи, и(х) - принимаемое решение (в простей- 
шем случае решениями могут быть элементы из У), 
ие У; ХАи) - условные функции плотности; 
Р(/и) - априорная вероятность появления класса /и. 
Если неизвестны условные функции плотности, ес- 
тественно использовать их непараметрические оцен- 
ки /Щ /и) по обучающим последовательностям 
Ху..., Ху тогда эмпирический риск (1), для целей 
экономии выборки, подсчитывается методом 
"скользящего" контроля. В качестве непараметри- 
ческой оценки неизвестной функции плотности бу- 
дем использовать следующую оценку с ядром Епа- 
нечникова с "внутренней" системой координат, обес- 
печивающей разворот эллипса рассеяния, согласо- 
ванный с рассеянием выборочных данных [9, 10] 
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где введена следующая вспомогательная система 
координат 

и = Сх, М[ШІ Т ] = СМ[Х Х]С Г = СК Ѵ С Т = А, 
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С - матрица декоррелирующего ортогонального 
преобразования, М[ ] - оператор математического 


ожидания, II - матрица ортогональных преобразо- 
ваний, X - центрированные наблюдения, А - диа- 
гональная матрица собственных значений, 
К ѵ - оценка ковариационной матрицы класса ѵ, 
а= 3/4x5, Ь=а/ 5, Я, - /- ое собственное значение, 
Н ѵ - параметр сглаживания класса ѵ. Особенность 
модифицированного ядра Епанечникова заключает- 
ся в том, что единый параметр сглаживания для всех 
размерностей пространства наблюдений масштаби- 
руется по координатам собственными значениями 
А„ /=1,...,и оценочной ковариационной матрицы Д, 

При использовании непараметрической оцен- 
ки неизвестных распределений (2) остается не до- 
определенным параметр сглаживания И„ таким об- 
разом, появляется возможность дополнительной 
адаптации вероятностных моделей образов к конк- 
ретным условиям наблюдений и обучающим вы- 
боркам. 

Для каждого компонента вектора плана экспе- 
риментов запоминается подмножество признаков, 
дающее минимальный эмпирический риск 
Е={Е',...,Е , ) Т . Затем из всех минимальных рисков 
выбирается самый минимальный У шк и, используя 
соответствующее этому риску подмножество приз- 
наков, проводится распознавание всего снимка 
скользящим окном. 

Иллюстрация работы алгоритма 

Для иллюстрации работы алгоритма были ис- 
пользованы снимки территории Томской области, 
зафиксированные радиометром АѴНК.К спутника 
МОАА в пяти спектральных диапазонах (1 канал - 
0, 58. ..0, 68 мкм, 2 канал -0,725. ..1,1 мкм, 3 канал - 

3.55. . .3.93 мкм, 4 канал - 1 0,3... 11,3 мкм, 5 канал - 

11.5.. . 12,5 мкм) с разрешением 1x1 км 2 на пиксел. 

Целью работы алгоритма было отделение снеж- 
ных покровов Земли от полей облачности для мо- 
ниторинга схода снега на территории Томской об- 
ласти. 

Некоторые результаты работы приведены на 
рис. 1-4. 

На рис. 1 представлен снимок территории 
Томской области, полученный 9 апреля 2004 г. раз- 
мером 1029x891 отсчет. Для работы алгоритма бы- 
ли заданы классы: "облака", "снег", "тайга" и "теп- 
ловая аномалия", в которых в качестве образцов 
были выделены 8, 18, 11 и 10 фрагментов соответ- 
ственно. Размер скользящего окна был задан 
8x8 точек (точка с координатами х=4, у= 4 счита- 
лась центральной). Данный размер скользящего 
окна выбран как компромиссное решение между 
желанием использовать как можно больший учас- 
ток однородной поверхности, но при этом сохра- 
нить пространственное разрешение конечной 
классификации. Вектор плана экспериментов сос- 
тоял из девяти единиц. 

На рис. 2 представлен результат применения ал- 
горитма к исходному снимку для выделения облач- 
ных полей и снежных покровов Земли. 
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Рис. 1. Исходный снимок территории Томской области 



| | "облака" Д "снег" Щ "тайга" Щ "тепловая аномалия" 


Рис. 2. Результат работы алгоритма 



Рис. 3. На экран отображены классы "снег" (светло-серый 
цвет) и "тепловая аномалия" (темно-серый цвет) на 
черном фоне 


На рис. 3 представлены два класса: "снег" и "теп- 
ловая аномалия" на черном фоне. На рисунке очень 
хорошо видны отроги Большого Васюганского боло- 
та, покрытые снегом, а также хорошо выделено алго- 


ритмом тепловое пятно на юге от Томской области. 
Из рисунка видно, что алгоритм уверенно отделяет 
подстилающую поверхность Земли, покрытую сне- 
гом, от поверхности, на которой снег уже сошел. 



Рис. 4. На экран отображены классы "снег" (светло-серый 
цвет) и "облака" (белый цвет) на черном фоне 


На рис. 4 представлены два класса: "снег" и "об- 
лака" на черном фоне. Визуальный анализ предс- 
тавленного изображения подтверждает, что алго- 
ритм достаточно уверенно отделяет снежный пок- 
ров и облачные поля друг от друга. 

Исходя из полученных данных, можно сказать, 
что на 9 апреля 2004 г. часть закрытой облаками по- 
верхности территории, представленной на изобра- 
жении, составляет 36,1 %; площади снежного пок- 
рова - 39,6 %; площади территории не занятой сне- 
гом - 12,7 %. 

Нами была проведена оценка качества алгорит- 
ма по эмпирическому риску (1) (рис. 5). На рис. 5 
по оси абсцисс для каждого значения вектора пла- 
на экспериментов отложено соответствующее ему 
подмножество наиболее информативных призна- 
ков из системы текстурно-спектральных призна- 
ков. То есть под 1 понимается подмножество из од- 
ного признака: вариация, посчитанная по второму 
каналу, под 2 - подмножество из двух признаков: 
вариация, посчитанная по второму каналу и энер- 
гия, посчитанная по первому каналу, под 3 - все 
признаки из подмножества 2 и спектральный приз- 
нак четвертого канала прибора АѴНКК спутника 
ІЧОАА, под 4 - все признаки из подмножества 3 и 
вариация, посчитанная по третьему каналу, под 5 - 
все признаки из подмножества 4 и первый началь- 
ный момент, посчитанный по третьему каналу, под 
6 - все признаки из подмножества 5 и вариация, 
посчитанная по четвертому каналу, и, наконец, под 
цифрой 7 имеем следующее подмножество спект- 
рально-текстурных признаков: вариация, посчи- 
танная по второму каналу, энергия, посчитанная по 
первому каналу, спектральный признак четвертого 
канала прибора АѴНКК спутника Ж)АА, вариа- 
ция, посчитанная по третьему каналу, первый на- 
чальный момент, посчитанный по третьему каналу. 
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вариация, посчитанная по четвертому каналу, 
спектральный признак третьего канала прибора 
АѴН К К. По оси ординат на рис. 5 отложено соот- 
ветствующее каждому подмножеству значение эм- 
пирического риска. 



1 23456789 

Рис. 5. Оценка качества подсистем текстурных признаков, 
посчитанная на основе эмпирического риска 


На кривой рис. 5 можно увидеть, что при ис- 
пользовании одного признака для распознавания 
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изображения значение эмпирического риска будет 
равно 0,3. При добавлении еще одного наиболее 
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